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© Verfahren zur automatisierten Erkennung von Objekten 

(57) Die Erfindung betrifft ein verbessertes bildverarbeitendes 
Verfahren zur automatisierten Erkennung oder Verifikation 
von Objekten aus digitalen Bildern dieser Objekte. Dieses 
Verfahren ist dadurch gekennzeichnet, daS man aus einem 
digitalen Biid mit Gabor-Filtern verschiedener Gro&e und 
Orientierung Gabor-Merkmale extrahiert, welche auf einem 
verschieb-, skalier- und deformierbaren Gitter, dem Gra- 
phen, angeordnet werden, dessen optimale Form durch die 
zweiphasige Minimierung einer Graphen-Vergleichsfunktion 
bestimmt wird, In der ersten Phase werden sowohl GroGe als 
auch Position des Graphen simultan optimiert, in derzweiten 
Phase wird die intrinsische Form des Graphen optimiert. 
Das Verfahren ist gegenuber dem Stand der Technik 
dahingehend verbessert, dafc gieiche Objekte auch bei 
unterschiediicher AbbildungsgrdGe erkannt werden und dafc, 
besonders fur die Aufgabe der Verifikation, ein wesentiich 
beschleunigtes Optimierungsverfahren angegeben werden 
konnte. 

Die Erfindung betrifft ferner den Einsatz automatisierter 
bildverarbeitender Gesichtserkennungsverfahren zur An- 
wendung in Personenzugangskontroilsystemen oder ande- 
ren Einrichtungen zur Identitatsuberprufung. 
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Beschreibung 

Die Erfindung betrifft ein automatisiertes bildverar- 
beitendes Verfahren zur groBen- und lageinvarianten 
Erkennung von intrinsisch deformierbaren Objekten, 5 
insbesondere Gesichtern. 

Seit einigen Jahren sind auf dem Gebiet der Bildver- 
arbeitung Verfahren bekannt, die eine Erkennung von 
Objekten aus einzeinen Ansichten (Bildern) dieser Ob- 
jekte erlauben. Diese Verfahren zeichnen sich durch 10 
eine mehr oder weniger starke Robustheit gegeniiber 
Variationen der Objektansichten (Lage, Orientierung 
im Raum, GroBe, objektintrinsische Verzerrungen, Be- 
leuchtung) aus. Insbesondere beschaftigen sich zahlrei- 
che Arbeiten mit dem schwierigen Problem der Erken- 15 
nung von Gesichtern, welche eine Klasse von Objekten 
mit zahlreichen intrinsischen Deformationsfreiheitsgra- 
den (Mimik) darstellen. 

In den zahlreichen Arbeiten in einschlagigen Fach- 
zeitschriften, die sich mit der Erkennung von Gesichtern 20 
beschaftigen und die in einschlagigen Fachzeitschriften 
publiziert sind, werden folgende Losungsansatze vorge- 
schlagen: 

1. Bichsel und Seitz, DAGM, S. 106 — 1 13, Springer- 25 
Verlag 1990 haben vorgeschlagen, aus Bildern ex- 
trahierte Merkmale einem Neuronalen Netz 
(Mehrlagen-Perzeptron) zuzufiihren. Ein sehr ahn- 
licher Ansatz wird in Bouattour, Fogelman-Soulie 

et al., Artificial Neural Networks 2, S. 456, Elsevier- 30 
Verlag 1992 gewahlt. In Lampinen, Artificial Neu- 
ral Networks, S. 328, Elsevier- Verlag 1991 wird zur 
Merkmalsklassifikation die Faktorenanalyse und 
ein neuronales Kohonen-Netz benutzt. Der Nach- 
teil all dieser Verfahren ist, daB fur jede neu zu 35 
erkennende Person eine ganze Reihe von Ansich- 
ten aufgenommen werden muB und daB die Neuro- 
nalen Netze sodann erneut trainiert werden mus- 
sen. AuBerdem werden Ergebnisse dieser Verfah- 
ren in Form von Erkennungsraten nur fur kleine 40 
Datenbanken (3—20 Personen) berichtet. Es muB 
davon ausgegangen werden, daB die Erkennungs- 
rate mit steigender Personenzahl abnimmt 

2. Aus Lades et al., IEEE Transaction on Compu- 
ters, 42, 300—311, 1993 [Lades'93] ist ein Ansatz 45 
bekannt, bei dem der Vergleich zwischen zu erken- 
nendem und gespeichertem Bild durch einen flexi- 
blen Abbildungsmechanismus realisiert wird, wobei 
die bestmdgliche Abbildung durch ein Optimie- 
rungsverfahren bestimmt wird. Dieses Verfahren 50 
ist sehr leistungsfahig in bezug auf Lage, Orientie- 
rung im Raum und objektintrinsische Verzerrun- 
gen, ferner werden auch bei groBen Personenzah- 
len (> 100) hohe Erkennungsraten erreicht. Es hat 
jedoch den Nachteil, daB es keine groBeninvariante 55 
Erkennung erlaubt. 

3. Ein interessantes Verfahren, das ebenfalls eine 
Abbildung zwischen Bildern durch ein Optimie- 
rungsverfahren realisiert, wird von M. Shackelton, 
Patentschrift WO 93/15475, 1993 [Shackelton'93] 6 o 
beschrieben. Das Verfahren findet in Bildern auto- 
matisch hervorspringende Merkmale und verbin- 
det diese zu einer netzartigen Struktur (Template). 
Solche Templates konnen prinzipiell dazu benutzt 
werden, ahnliche Bilder miteinander zu vergleichen 65 
und konnen somit auch zum Vergleich von Gesich- 
tern herangezogen werden. Es werden allerdings in 
[Shackelton'93] keine weiteren Angaben dazu ge- 
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macht, wie ein solcher Vergleich verschiedener Bil- 
der gleicher Objekte im Detail aussehen kann und 
welche Gute der Klassifizierung damit erreicht 
werden kann. 

Bezogen auf Personenzugangskontrollen gibt es im 
Stand der Technik keine gewerblichen Anwendungen, 
die die automatisierte, lage- und groBeninvariante Er- 
kennung von Gesichtern als Kontrollmerkmal einset- 
zen. 

Zum besseren Verstandnis der hier vorliegenden Er- 
findung wird im folgenden der Stand der Technik, wie er 
durch [Lades'93] vorgegeben ist, detaillierter darge- 
stellt Dazu werden zunachst einige fur die Erfindung 
wesentlichen Begriffe und Bezeichnungsweisen zusam- 
mengefaBt: 

Es ist Stand der Technik, wie er beispielsweise in der 
Arbeit von D. J. Field, Journal Opt. Soc. Am. A4, S. 
2379 — 2394, 1987 dargestellt ist, daB zur Merkmalsex- 
traktion aus Bildern Filteroperationen (mathematisch: 
Faltungen) mit bestimmten Filtermasken verwendet 
werden. Eine bestimmte Klasse von Filtermasken sind 
die Gabor-Filter. Verschiedene Gabor-Filter unter- 
scheiden sich in GroBe und Orientierung in der Bildebe- 
ne: 

— Ein Gabor-Merkmal bezeichnet das Ergebnis 
einer Faltung des Bildes an einem bestimmten Pixel 
mit einem bestimmten Gabor-Filter. 

— Ferner bezeichnet, wenn ein Bild mit k verschie- 
denen Gabor-Filter gefaltet wurde, ein Jet die Ge- 
samtheit aller Gabor- Merkmale an einem bestimm- 
ten Pixel, die in dem Jet zu einem k-komponentigen 
Vektor zusammengefaBt werden. 

— Ein regularer Graph ist die Zusammenfassung 
von m x n Jets in einer zweidimensionalen, gitter- 
formigen Anordnung (s. Bild la). Jeder Jet ist einem 
der Knoten des Gitters zugeordnet; benachbarte 
Knoten werden durch horizontale und vertikale 
Verbindungen miteinander verkniipft. Fur zu spei- 
chernde Objektbilder wird die Information tiber ein 
Objektbild in Form von regularen Graphen abge- 
legt. 

— Ein irregularer Graph besteht ebenfalls aus m x 
n Knoten, die in gleicher Topologie wie beim regu- 
laren Graphen verkniipft sind, jedoch liegen hier 
die Knoten nicht notwendigerweise auf einem 
rechteckigen Gitter, sondern sind beliebig in der 
Bildebene angeordnet (s. Bild lb). Es werden den 
Knoten jeweils die Jets zugeordnet, die zu dem 
Pixel gehoren, auf dem der Knoten zu liegen 
kommt. 

— Die horizontalen und vertikalen Verbindungen 
zwischen benachbarten Knoten werden auch als 
Links bezeichnet 

— Zur Bewertung der Ahnlichkeit zweier Graphen 
(regular oder irregular) wird eine Graphen- Ver- 
gleichsfunktion E eingefiihrt: 

E — Esim + XEtop (1) 

Diese Funktion nimmt um so niedrigere Werte an, 
je ahnlicher zwei Graphen sind. Der erste Term 
Esim bewertet die Ahnlichkeit der Jets an jeweils 
korrespondierenden Knoten der beiden Graphen, 
indem die jeweils korrespondierenden Gabor- 
Merkmale miteinander verglichen werden (negati- 
ver Kosinus des Winkels zwischen beiden Jets); ho- 
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he Ahnlichkeit bedeutet dabei niedrige Werte von 
Esinv Der zweite Term E top bewertet die topologi- 
sche Ahnlichkeit beider Graphen, indem die Betra- 
ge der Differenzvektoren jeweils korrespondieren- 
der Links aufsummiert werden. (Ein anschauliches 5 
Modell besteht darin, sich die Links als mechani- 
sche Federn vorzustellen, die in ihren Ruheiagen 
den ersten der beiden Graphen bilden. E t0 p ist dann 
proportional zur Arbeit, die gegen die Federkrafte 
aufgebracht werden muB, um die Links mit der To- 10 
pologie des zweiten Graphen zur Deckung zu bnn- 
gen.) 

- Werden betm Vergleich eines neuen Objektbil- 
des mit N gespeicherten Objekten N Werte der 
Graphen- Vergleichsfunktion Ei < E 2 < . . . < En er- 15 
mittelt, so bezeichnen E und oe den Mittelwert und 
die Standardabweichung der Daten (E 2 , . . * , En), 
und Objekt 1 ist im Sinne der Vergleichsfunktion 
das ahnlichste Objekt. Die Ahnlichkeit wird als si- 
gnificant bezeichnet und wir sprechen von signifi- 20 
kanter Erkennung, wenn fur fest gewahlte Parame- 
ter Si, s 2 mindestens eines der Kriterien 
(Ei - E)/cje > si oder (Ei - E 2 )/oe > s 2 erfullt ist. An- 
dernfalls sprechen wir von insignifikanter Erken- 
nung, und das neue Objekt wird als unahnlich zu 25 
alien gespeicherten Objekten zuruckgewiesen. 

In [Lades'93] wird nun ein Verfahren beschrieben, das 
Gabor-Merkmale verschiedener Orientierung und Ska- 
lierung aus einem Bild extrahiert und diese fur jedes 30 
Pixel in Form von Jets zusammenfaBt. Fur ein zu spei- 
cherndes Objektbild werden die Jets in einem regularen 
Graphen, der auf das Objekt zentriert ist, zusammenge- 
faBt In einem neuen Bild wird ein optimal zu dem ge- 
speicherten Graphen passender Graph gesucht. Dabei 35 
enthalt der neue Graph an seinen Knoten jeweils die 
Jets, die zu dem Pixel am Ort des Knoten gehoren. Seine 
Position und Form wird in einem Zweiphasenverfahren 
optimiert: 

40 

1. Verschiebung des Graphen als Ganzes (Global 
Move), bis ein Optimalzustand gefunden wird. 

2. Ausgehend vom Optimalzustand aus 1. werden 
einzelne Knoten des Graphen verschoben (lokale 
Verzerrung). 45 

In beiden Phasen lauft die Optimierung folgenderma- 
Ben ab: Es wird ein zufalliger Verschiebungsvektor aus- 
gewahlt und auf den Graphen bzw. einen Knoten des 
Graphen angewendet Der Zustand des so veranderten 50 
Graphen wird mittels der Graphen- Vergleichsfunktion 
E bewertet. Nur wenn der neue Zustand eine gunstige- 
ren Wert fur E hat, wird die Verschiebung akzeptiert 

Beide Phasen terminieren, wenn in V max aufeinander- 
folgenden Verschiebungsschritten keine Verbesserung 55 
gefunden wird. Das Ergebnis der Optimierung ist der 
finale Wert der Graphen-Vergleichsfunktion E. Die Op- 
timierung wird fur alle gespeicherten Graphen wieder- 
holt, und man erhalt eine Sequenz von Werten Ei < E 2 
< E 3 < . . . anhand welcher bestimmt werden kann, ob ec 
eine signifikante Erkennung von Objekt 1 vorliegt. 

Das beschriebene Verfahren hat jedoch folgende 
Nachteile: 

— Es ist nicht groBeninvariant, da der Graph nur 6£ 
verschoben, nicht skaliert wird. Es wurde bisher in 
der Literatur (Buhmann et al., IJCNN II, 411—416, 
IEEE, San Diego, 1990) davon ausgegangen, daS 
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bei Skalierung des Graphen auch die Filterkoeffi- 
zienten entsprechend inter- bzw. extrapoliert wer- 
den mussen. Ein solches Verfahren ist rechenauf- 
wendig. da nach jedem Opttmierungsschritt inter- 
poliert werden muB. Ferner wurde bisher davon 
ausgegangen, daB die GroBenbestimmung nur 
durch ein hierarchisches Verfahren, das von groben 
zu feinen Auflosungsstufen fortschreitet, geiingt. 
Die hier beschriebene Erfindung lost die Aufgabe 
der groBeninvarianten Erkennung durch ein deut- 
lich vereinfachtes Verfahren. 

— Der Suchaufwand wachst linear mit der Anzahl 
der gespeicherten Objekte. Ferner wird die korrek- 
te Erkennung mit zunehmender Objektanzahl im- 
mer schwieriger. Damit wird der Einsatz in groBen 
Datenbanken problematisch. Die hier dargestelite 
Erfindung beschreibt ein neues Verfahren, die Ver- 
ifikation, welches die obigen Nachteile vermeidet. 
Dieses Verfahren laBt sich daruber hinaus beson- 
ders gut mit der groBeninvarianten Erkennung 
kombinieren. 

Die aus dem Stand der Technik bereits bekannten 
Verfahren weisen eine Reihe von Nachteilen auf und 
vermogen nicht, in jeder Hinsicht zu befriedigen. Es 
besteht daher ein standiger Bedarf an verbesserten Ver- 
fahren zur Erkennung intrinsisch deformierbarer Ob- 
jekte. 

Aufgabe der vorliegenden Erfindung war es, ein ge- 
genuber dem bekannten Stand der Technik verbesser- 
tes Verfahren zur Erkennung von Objekten zur Verfii- 
gung zu steilen. Dabei war angestrebt, eine Moglichkeit 
zur Differenzierung dahingehend zu schaffen, daB ver- 
schiedene Bilder desselben Objektes (mit Unterschie- 
den in Lage, Ansicht und GroBe des Objektes) als ahn- 
lich erkannt werden, wahrend Bilder von verschiedenen 
Objekten als unahnlich klassifiziert werden. 

Eine weitere Zielsetzung bestand darin, eine techni- 
sche Verwendung dieses Verfahrens als Personenzu- 
gangskontrollsystem zu entwickeln, das auf einem ver- 
besserten Verfahren zur Erkennung von Gesichtern ba- 
siert. Dabei besteht die Aufgabe insbesondere darin, die 
Oberprufung der Zugangsberechtigung auch bei einem 
groBen Kreis berechtigter Personen schnell und sicher 
durchfuhren zu konnen. 

Uberraschenderweise wurde gefunden, daB man die 
groBeninvariante Objekt erkennung einfach dadurch 
deutlich verbessern kann, daB man den Global Move 
simultan mit einem Global Scale verbindet, indem man 
den Graphen in jedem Optimierungsschritt sowohl ver- 
schiebt als auch mit einem Faktor nahe 1 skaliert. Eine 
Interpolation der Filterkoeffizienten ist entgegen der 
Erwartung fur einen weiten Bereich von ObjektgroBen 
(von etwa 60% bis 140% der OriginalgroBe) nicht not- 
wendig. Damit hat man eine gegeniiber bestehenden 
Losungen beschleunigte Anpassung auf GroBenande- 
rungen, wie sie fur viele Anwendungen von besonderer 
Bedeutung sind. 

Gegenstand der vorliegenden Erfindung ist ein Ver- 
fahren zur automatisierten Erkennung von Objekten 
aus Bildern dieser Objekte, wobei man aus einem digita- 
len Bild mit Gabor-Filtern verschiedener GroBe und 
Orientierung Gabor-Merkmale extrahiert, die in einem 
verschieb-, skalier- und deformierbarem Graphen G zu- 
sammengefafit werden. Fur jeden der gespeicherten 
Graphen optimiert man die Form und Lage des Gra- 
phen G dahingehend, daB die Graphen-Vergleichsfunk- 
tion E optimale Werte annimmt. Die Auffindung des 
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optimalen Graphen G fuhrt man dabei fur jeden der 
gespeicherten Graphen in zwei Phasen durch. 

Phase 1 

Auswahl eines zufalligen Verschiebungsvektors und 
Skalierungsfaktors fur den gesamten Graphen. Der so 
veranderte Graph im neuen Bild wird iiber die Gra- 
phen-Vergleichsfunktion E mit dem gespeicherten Gra- 
phen verglichen, wobei die Links des gespeicherten 
Graphen zuvor mit dem Skalierungsfaktor multipliziert 
werden. Nur wenn der neue Zustand einen giinstigeren 
Wert fur E hat, wird die Veranderung des Graphen 
akzeptiert. 

Phase 2 

Alle Links des gespeicherten Graphen werden mit 
dem in Phase 1 ermittelten optimalen Skalierungsfaktor 
multipliziert. Ausgehend vom in Phase 1 ermittelten Op- 
timalzustand des neuen Graphen werden einzelne Kno- 
ten dieses Graphen verschoben (lokale Verzerrung), bis 
ein optimaler irregularer Graph gefunden wird (Bild 2). 

In einer bevorzugten Ausfuhrungsform der vorlie- 
genden Erfindung wird in jedem Optimierungsschritt 
der Phase 1, ausgehend von der momentanen Graphen- 
Lage und -GroBe, zufallig eine Verschiebung von bis zu 
3% der BildgroBe und gleichzeitig eine Skalierung des 
Graphen von bis zu 10% der GraphengroBe gewahlt. 
Allerdings liefert das Verfahren bei den untersuchten 
Bildern in einem weiten Bereich von Parametern anna- 
hernd gleich gute Ergebnisse. 

Mit dieser Ausfuhrungsform werden fur Bilder, die 
gespeicherte Objekte in einer um 75% kleineren Skalie- 
rung zeigen, die richtigen Skalierungsfaktoren mit einer 
Genauigkeit von ±2% ermittelt Dies zeigten Versuche, 
in denen man 12 Gabor- Filter (4 aquidistante Orientie- 
rungen mit je 3 verschiedenen GroBen, gekennzeichnet 
durch ihre Optimalfrequenzen f, die, beginnend bei der 
hochsten Frequenz von f = n/2, im Abstand von halben 
Oktaven aufeinanderfolgen) verwendet. Die 12-kompo- 
nentigen Jets werden in einem 7 x 10-Graphen angeord- 
net und als Bildmaterial werden Gesichtsbilder 
(128 x 128 Pixel) von Personen vor weiBem Hintergrund 
verwendet, wie sie in [Lades'93] dargestellt sind. Unter 
diesen Voraussetzungen wird von verschiedenen An- 
fangslagen und -groBen des Graphen G aus die optimale 
GraphengroBe (also hier um 75% kleiner) mit einer Re- 
produzierbarkeit von ± 2% angefahren. 

In einer weiteren Ausfuhrungsform der Erfindung 
wird die Optimierung des Graphen G nur einmal in 
Hinblick auf einen der gespeicherten Graphen (Refe- 
renzgraph) durchgefuhrt und bleibt dabei auf die Phase 
1 beschrankt. Der so ermittelte optimale Graph G wird 
dann ohne weitere Optimierungsschritte mit alien ge- 
speicherten Graphen verglichen. Uberraschenderweise 
wurde gefunden, daB trotz des drastisch reduzierten 
Optimierungsaufwand fast gleichbleibend gute Erken- 
nungsleistungen erzielt werden. Diese Ausfuhrungs- 
form hat den Vorteil, daB sie bedeutend schneller durch- 
gefuhrt werden kann und damit auch in der Anwendung 
auf groBe Datenbanken gespeicherter Graphen geeig- 
net ist. 

Neben der Erkennung (Suchen eines Objektes unter 
einer Anzahl gespeicherter Objektbilder) eignet sich 
das Verfahren auch besonders gut zur Verifikation, d. h. 
zur Entscheidung, ob ein vorgegebenes Objektbild mit 
einem bestimmten gespeicherten Objektbild B (dessen 



Graph als Referenzgraph benutzt wird) iibereinstimmt. 
Dazu wird das vorgegebene Bild O auBer mit dem ge- 
speicherten Bild B auch mit N zufallig ausgewahlten 
anderen gespeicherten Bildern verglichen, um zu ent- 
5 scheiden, ob die Ahnlichkeit zwischen B und O signifi- 
kant ist. Dabei ist N eine feste, nicht von der Gesamt- 
groBe der Datenbank abhangige Zahl, so daB in diesem 
Verfahren der Rechenaufwand unabhangig von der 
GroBe der Datenbank ist. Der Vergleich mit N weiteren 

io gespeicherten Bildern bietet den Vorteil, daB Unter- 
schiede, die durch eine geanderte Aufnahmesituation 
beim vorgegebenen Bild (z. B. durch andere Beleuch- 
tung) entstehen, getrennt werden von Unterschieden in 
den Objekten selbst. 

15 Gerade fur diese Verifikationsaufgabe eignet sich die 
oben beschriebene Ausfuhrungsform, bei der zur Re- 
duktion des Rechenaufwandes die Optimierung nur mit 
einem Referenzgraphen (namlich B) durchgefuhrt und 
bereits nach Phase 1 abgebrochen wird, besonders gut. 

20 Dies zeigen die folgenden Versuchsergebnisse: 88 
Objektbilder von Gesichtern mit ca. 20° zur Seite ge- 
drehtem Kopf werden mit 100 gespeicherten Bildern 
von geradeaus blickenden Personen verglichen. In einer 
Ausfuhrungsform der Erfindung werden 40 Gabor-Fil- 

25 ter (8 aquidistante Orientierungen mit je 5 verschiede- 
nen GroBen, gekennzeichnet durch ihre Optimalfre- 
quenzen f, die, beginnend bei der hochsten Frequenz 
von f = 7t/2, im Abstand von halben Oktaven aufeinan- 
derfolgen) und 7 x 10-Graphen verwendet. Die Schwel- 

30 len si und S2 werden so eingestellt, daB Objektbilder zu 
100% zuriickgewiesen werden, wenn das zugehorige 
gespeicherte Bild (temporar) aus der Datenbank ent- 
fernt ist. Wird nun das zugehorige gespeicherte Bild 
wieder eingefugt, so ergeben sich mit den gleichen 

35 Schwellen folgende Raten der korrekten und signifikan- 
ten Erkennung (N = 1 00): 



Erkennung, mit Phase 1 und 2 
Verifikation, mit Phase 1 und 2 
40 Verifikation, nur Phase 1 



84% 
93% 
91% 



Bei einem Versuch zur groBeninvarianten Verifika- 
tion, in dem 88 Objektbilder mit 20° Kopfdrehung durch 

45 89 Bilder von Gesichtern in reduzierter GroBe (75%) 
ersetzt werden, ergibt sich eine Verifikationsrate (nur 
Phase 1) von 83%. 

Insgesamt erlaubt das Verfahren somit eine automati- 
sierte Erkennung oder Verifikation von Objekten aus 

50 digitalen Bildern dieser Objekte unter Benutzung von 
Gabor-Merkmalen, welche auf einem verschieb-, ska- 
lier- und deformierbarem Gitter, dem Graphen, ange- 
ordnet sind, dessen optimale Form durch die zweiphasi- 
ge Minimierung der Graphen- Vergleichsfunktion be- 

55 stimmt wird. In der ersten Phase werden sowohl GroBe 
als auch Position des Graphen simultan optimiert. 

Fur viele Anwendungen der visuellen Objekterken- 
nung spielt die Invarianz gegen GroBen- und Positions- 
anderungen von Objekten eine besonderer Rolle. Bei- 

60 spielsweise sind Personen-Zugangskontrollen mit auto- 
matischer Kamera ("elektronischer Pfortner") nur dann 
in der Praxis einsetzbar, wenn Abstand und Position der 
Person vor der Kamera in bestimmten Grenzen varia- 
bel sind. Das hier beschriebene Verfahren eignet sich 

65 besonders gut fur eine solche Anwendung, zumal auch 
eine Unterscheidung bei einer groBen Zahl von Perso- 
nen moglich ist. Gegenuber einem menschlichen Pfort- 
ner bietet das automatisierte Verfahren die Vorteile 
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groBerer Objektivitat, Reproduzierbarkeit und Ermu- 
dungsfreiheit. 

Fur Personen-Zugangskontrollen mussen hohe Si- 
cherheitsstandards eingehalten werden. Das hier be- 
schriebene Verfahren bietet den Vorteil einer hohen 5 
Sicherheit bei der Zuruck-Weisung unberechtigter Per- 
sonen (100% auf dem Testdatenmaterial). Das hier be- 
schriebene Verfahren eignet sich auch dann besonders 
gut, wenn es in Verbindung mit anderen Zugangskon- 
troll-MaBnahmen (z. B. Codekarten) eingesetzt wird. \o 
Durch diese Kombination entstehen folgende Vorteile: 

— Eine Person, die unberechtigterweise in den Be- 
sitz einer Codekarte gelangt oder eine solche 
falscht, kann alleine durch die Codekarte noch kei- 15 
nen Zugang erlangen. Dies fuhrt zu einer Erhohung 
der Sicherheit 

— Durch die Codekarteninformation kann vorge- 
geben werden, welches der gespeicherten Gesich- 
ter zu erkennen ist. Die automatische Erkennung 20 
wird reduziert auf die Aufgabe der automatischen 
Verifikation, ob das aktuelle Bild eine signifikante 
Ahnlichkeit mit dem gespeicherten Bild aufweist. 
Im Gegensatz zur Erkennung ist der Rechenauf- 
wand fur die Verifikation unabhangig von der Gro- 25 
Be der Datenbank; das Verfahren kann somit auch 
fur sehr groBe Datenbanken eingesetzt werden. 

Personen-Zugangskontrollen sind nur ein Beispiel fur 
die technische Anwendbarkeit des Gesichtserkennungs- 30 
verfahrens. Allgemeiner kann ein Verfahren, bei dem 
mit einer Kamera ein Gesichtsbild aufgenommen und 
mit gespeicherten Bildern verglichen wird, zur beruh- 
rungslosen Identitatsuberprufung einsetzen. Diese kann 
dazu benutzt werden, personenbezogene Einstellungen 35 
an einem technischen Gerat vorzunehmen (beispiels- 
weise Fahrersitz-Einstellung im Auto) oder personenbe- 
zogene Zugangsrechte an einem technischen Gerat ein- 
zuraumen. 

Besonders vorteilhaft laBt sich ein solches beruh- 40 
rungsloses Kontrollverfahren in Kombination mit ande- 
ren Identifikationsmerkmalen zur Verifikation einset- 
zen. Es gelten sinngemaB die gleichen Vorteile wie bei 
der Verifikation in Personen-Zugangskontrollen. 

Das beschriebene Verfahren laBt sich auch vorteilhaft 45 
fur die Bestimmung der Ahnlichkeit zwischen Objekt- 
bildern heranziehen. Als AhnlichkeitsmaB dient der am 
Ende der Optimierung erhaltene Wert der Graphen- 
Vergleichsfunktion. Damit lassen sich groBe Datenban- 
ken automatisch nach ahnlichen Objekten durchsuchen. 50 
Da nur diese fur eine weitere (menschliche) Begutach- 
tung herangezogen werden mussen, bedeutet dies einen 
erheblichen Zeitgewinn. Besonders geeignet ist das Ver- 
fahren auch dazu, die Ahnlichkeit zwischen Phantombil- 
dern von Gesichtern und gespeicherten Gesichtsfoto- 55 
grafien zu ermitteln. 

SchlieBlich laBt sich das Verfahren auch zur automati- 
sierten visuellen Qualitatskontrolle einsetzen. In Pro- 
duktionsprozessen steht man oft vor der Aufgabe, daB 
die Obereinstimmung aktuell vorliegender Teile mit den 6 o 
Sollangaben abgepruft werden muB (Beispiel Bestuk- 
kung elektronischer Platinen). Oft scheitert die Automa- 
tisierung der visuellen Priifung an der mangelnden Ro- 
bustheit der eingesetzten Verfahren. Das hier beschrie- 
bene Verfahren laBt sich besonders dann vorteilhaft ein- 65 
setzen, wenn in ihrer grundsatzlichen Struktur ahnliche 
Produktionsteile sicher auseinandergehaiten werden 
mussen. 
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Patentanspriiche 

1. Verfahren zur automatisierten Erkennung von 
Objekten aus Bildern dieser Objekte, wobei man 
aus einem digitalen Bild mit Gabor-Filtern ver- 
schiedener GroBe und Orientierung Gabor-Merk- 
male extrahiert, die in einem verschieb-, skalier- 
und deformierbarem Graphen G zusammengefaBt 
sind und mit gespeicherten Graphen von anderen 
Bildern verglichen werden, indem eine Graphen- 
Vergleichsfunktion E, bestehend aus einem die 
Ahnlichkeit der Gabor-Merkmale bewertenden 
Anteil und einem die Formerhaltung des Graphen 
bewertenden Anteil, berechnet wird, dadurch ge- 
kennzeichnet, daB man durch schrittweise und si- 
multane Veranderungen von Lage und GroBe des 
Graphen G diesen im Vergleich zu einem gespei- 
cherten Referenzgraph optimal einstellt (Phase 1) 
und mit diesem G die Werte von E fur jeden der 
gespeicherten Graphen ermittelt, wobei der Ab- 
stand des besten Wertes von den iibrigen E-Werten 
eine Entscheidung daruber erlaubt, ob eine signifi- 
kante Erkennung vorliegt. 

2. Verfahren nach Anspruch 1, wobei man die Opti- 
mierung des Graphen G in Phase 1 dahingehend 
erweitert, daB fur jeden der gespeicherten Graphen 
schrittweise Formveranderungen (lokale Verzer- 
rungen), die zu einer Verbesserung der Graphen- 
Vergleichsfunktion E fuhren, angewandt werden 
(Phase 2). 

3. Verfahren nach Anspruch 1 oder 2, wobei man in 
jedem Optimierungsschritt der Phase 1 zufallig ei- 
ne Verschiebung von bis zu 3% der BildgroBe und 
eine Skalierung des Graphen von bis zu 10% ein- 
stellt. 

4. Verfahren nach einem der Anspruche 1 bis 3, 
wobei man die GroBen der eingesetzten Gabor-Fil- 
ter so wahlt, daB ihre jeweiligen Bestfrequenzen im 
Abstand von Halboktaven aufeinanderfolgen und 
mindestens drei verschiedene GroBen verwendet. 

5. Gerat zur beruhrungslosen Identitatsuberpru- 
fung, bestehend aus Kamera und Computer, da- 
durch gekennzeichnet, daB ein durch die Kamera 
aufgenommenes Gesichtsbild durch eines der in 
den Anspriichen 1 bis 4 genannten Verfahren mit 
alien gespeicherten Gesichtsbildern von Personen 
automatisch verglichen wird, und bei einer signifi- 
kanten Erkennung einer der gespeicherten Perso- 
nen eine personenbezogene Aktion ausgelost wird. 

6. Personen-Zugangskontrolle, bestehend aus Ka- 
mera, Computer und elektrischer Zugangsentriege- 
lung, dadurch gekennzeichnet, daB ein durch die 
Kamera aufgenommenes Gesichtsbild durch eines 
der in den Anspruchen 1 bis 4 genannten Verfahren 
mit alien gespeicherten Gesichtsbildern von zu- 
gangsberechtigten Personen automatisch vergli- 
chen wird, und bei einer signifikanten Erkennung 
eines der gespeicherten Gesichter die Zugangsen- 
triegelung betatigt wird. 

7. Personen-Zugangskontrolle, bestehend aus Ka- 
mera, Computer, elektrischer Zugangsentriegelung 
und einem davon unabhangigen weiteren Kontroll- 
gerat, durch das die Identitat der zu erkennenden 
Person vorgegeben wird, dadurch gekennzeichnet, 
daB diese Identitat verifiziert wird, indem das zuge- 
horige gespeicherte Gesichtsbild B mit einem 
durch die Kamera aufgenommenen aktuellen Ge- 
sichtsbild nach einem der in den Anspruchen 1 bis 4 
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genannten Verfahren verglichen wird und bei posi- 
tiver Signifikanz die Zugangsentriegelung betatigt 
wird. 

8. Verfahren zur Datenbanksuche in Bilddatenban- 
ken, dadurch gekennzeichnet, daB zu einem vorge- 5 
legten Bild nach einem der in den Anspriichen 1 bis 

4 beschriebenen Verfahren alle hinreichend ahnli- 
chen Bilder in der Datenbank gefunden werden, 
weiche sich dadurch auszeichnen, daB fur sie die 
Graphen-Vergleichsfunktion niedrigere Werte als 10 
fur alle anderen Bilder annimmt. 

9. Automatisierte visuelle Qualitatskontrolle im 
ProduktionsprozeB, bestehend aus Kamera, Com- 
puter und Aussonderungsmechanismus, dadurch 
gekennzeichnet, daB die aktuell produzierten Teile 15 
uber eines der in den Anspriichen 1 bis 4 beschrie- 
benen Verfahren mit SoIIangaben verglichen wer- 
den und bei Vorliegen einer Diskrepanz der Aus- 
sonderungsmechanismus betatigt wird. 

20 
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Abbildung 1: (a) Regularer, (b) irregulaxer Graph, bestehend aus jeweils 7 x 10 Knoten. 





Abbildung 2: Optimierung des gespeicherten Graphen auf ein kleineres Objekt: (a) ge- 
speichertes Objektbild B mit gespeichertem Graphen; (b) vorgegebenes Objektbild O mit 
gefundenem Graphen nach Optimierung, Phase 1, (c) nach Optimierung, Phase 1+2. 
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